Ký hiệu Nguyên_lý_cực_đại_Pontryagin

Trong phần tiếp theo chúng ta sẽ học cách sử dụng các ký hiệu sau đây.

Ψ T ( x ( T ) ) = ∂ Ψ ( x ) ∂ T | x = x ( T ) {\displaystyle \Psi _{T}(x(T))={\frac {\partial \Psi (x)}{\partial T}}|_{x=x(T)}\,} Ψ x ( x ( T ) ) = [ ∂ Ψ ( x ) ∂ x 1 | x = x ( T ) ⋯ ∂ Ψ ( x ) ∂ x n | x = x ( T ) ] {\displaystyle \Psi _{x}(x(T))={\begin{bmatrix}{\frac {\partial \Psi (x)}{\partial x_{1}}}|_{x=x(T)}&\cdots &{\frac {\partial \Psi (x)}{\partial x_{n}}}|_{x=x(T)}\end{bmatrix}}} H x ( x ∗ , u ∗ , λ ∗ , t ) = [ ∂ H ∂ x 1 | x = x ∗ , u = u ∗ , λ = λ ∗ ⋯ ∂ H ∂ x n | x = x ∗ , u = u ∗ , λ = λ ∗ ] {\displaystyle H_{x}(x^{*},u^{*},\lambda ^{*},t)={\begin{bmatrix}{\frac {\partial H}{\partial x_{1}}}|_{x=x^{*},u=u^{*},\lambda =\lambda ^{*}}&\cdots &{\frac {\partial H}{\partial x_{n}}}|_{x=x^{*},u=u^{*},\lambda =\lambda ^{*}}\end{bmatrix}}} L x ( x ∗ , u ∗ ) = [ ∂ L ∂ x 1 | x = x ∗ , u = u ∗ ⋯ ∂ L ∂ x n | x = x ∗ , u = u ∗ ] {\displaystyle L_{x}(x^{*},u^{*})={\begin{bmatrix}{\frac {\partial L}{\partial x_{1}}}|_{x=x^{*},u=u^{*}}&\cdots &{\frac {\partial L}{\partial x_{n}}}|_{x=x^{*},u=u^{*}}\end{bmatrix}}} f x ( x ∗ , u ∗ ) = [ ∂ f 1 ∂ x 1 | x = x ∗ , u = u ∗ ⋯ ∂ f 1 ∂ x n | x = x ∗ , u = u ∗ ⋮ ⋱ ⋮ ∂ f n ∂ x 1 | x = x ∗ , u = u ∗ … ∂ f n ∂ x n | x = x ∗ , u = u ∗ ] {\displaystyle f_{x}(x^{*},u^{*})={\begin{bmatrix}{\frac {\partial f_{1}}{\partial x_{1}}}|_{x=x^{*},u=u^{*}}&\cdots &{\frac {\partial f_{1}}{\partial x_{n}}}|_{x=x^{*},u=u^{*}}\\\vdots &\ddots &\vdots \\{\frac {\partial f_{n}}{\partial x_{1}}}|_{x=x^{*},u=u^{*}}&\ldots &{\frac {\partial f_{n}}{\partial x_{n}}}|_{x=x^{*},u=u^{*}}\end{bmatrix}}}

Ở đây, các điều kiện cần được dùng để cực tiểu hóa một hàm. Với  x {\displaystyle x}  là trạng thái của hệ thống động học với đầu vào  u {\displaystyle u} , do đó

x ˙ = f ( x , u ) , x ( 0 ) = x 0 , u ( t ) ∈ U , t ∈ [ 0 , T ] {\displaystyle {\dot {x}}=f(x,u),\quad x(0)=x_{0},\quad u(t)\in {\mathcal {U}},\quad t\in [0,T]}

trong đó  U {\displaystyle {\mathcal {U}}}  là tập hợp các điều khiển chấp nhận được và  T {\displaystyle T}  là thời gian cuối (tức là cuối cùng) của hệ thống. Điều khiển  u ∈ U {\displaystyle u\in {\mathcal {U}}}  phải được chọn cho tất cả  t ∈ [ 0 , T ] {\displaystyle t\in [0,T]} để cực tiểu hóa mục tiêu chức năng J {\displaystyle J} được định nghĩa bởi ứng dụng và có thể được tóm tắt như sau

J = Ψ ( x ( T ) ) + ∫ 0 T L ( x ( t ) , u ( t ) ) d t {\displaystyle J=\Psi (x(T))+\int _{0}^{T}L(x(t),u(t))\,dt}

Các hạn chế về các động học của hệ thống có thể được nối liền với Lagrange  L {\displaystyle L}  bằng cách giới thiệu vectơ nhân tử Lagrange vector thời gian biến đổi  λ {\displaystyle \lambda } , mà các thành phần được gọi là các costate của hệ thống. Điều này thúc đẩy việc xây dựng Hamilton  H {\displaystyle H}  được định nghĩa cho mọi t ∈ [ 0 , T ] {\displaystyle t\in [0,T]} by:

H ( x ( t ) , u ( t ) , λ ( t ) , t ) = λ T ( t ) f ( x ( t ) , u ( t ) ) + L ( x ( t ) , u ( t ) ) {\displaystyle H(x(t),u(t),\lambda (t),t)=\lambda ^{\rm {T}}(t)f(x(t),u(t))+L(x(t),u(t))\,}

trong đó  λ T {\displaystyle \lambda ^{\rm {T}}}  là chuyển vị của  λ {\displaystyle \lambda } .

nguyên lý tối thiểu của Pontryagin phát biểu rằng quỹ đạo trạng thái tối ưu x ∗ {\displaystyle x^{*}} , điều khiển tối ưu  u ∗ {\displaystyle u^{*}} , và vectơ nhân tử Lagrange tương ứng λ ∗ {\displaystyle \lambda ^{*}} phải cực tiểu hóa Hamilton H {\displaystyle H}

( 1 ) H ( x ∗ ( t ) , u ∗ ( t ) , λ ∗ ( t ) , t ) ≤ H ( x ∗ ( t ) , u , λ ∗ ( t ) , t ) {\displaystyle (1)\qquad H(x^{*}(t),u^{*}(t),\lambda ^{*}(t),t)\leq H(x^{*}(t),u,\lambda ^{*}(t),t)\,}

đối với mọi thời gian t ∈ [ 0 , T ] {\displaystyle t\in [0,T]}  và mọi đầu vào điều khiển được phép u ∈ U {\displaystyle u\in {\mathcal {U}}} . Nó cũng là trường hợp

( 2 ) Ψ T ( x ( T ) ) + H ( T ) = 0 {\displaystyle (2)\qquad \Psi _{T}(x(T))+H(T)=0\,}

Ngoài ra, các phương trình costate

( 3 ) − λ ˙ T ( t ) = H x ( x ∗ ( t ) , u ∗ ( t ) , λ ( t ) , t ) = λ T ( t ) f x ( x ∗ ( t ) , u ∗ ( t ) ) + L x ( x ∗ ( t ) , u ∗ ( t ) ) {\displaystyle (3)\qquad -{\dot {\lambda }}^{\rm {T}}(t)=H_{x}(x^{*}(t),u^{*}(t),\lambda (t),t)=\lambda ^{\rm {T}}(t)f_{x}(x^{*}(t),u^{*}(t))+L_{x}(x^{*}(t),u^{*}(t))}

phải được thỏa mãn. Nếu trạng thái cuối  x ( T ) {\displaystyle x(T)} không cố định (ví dụ, biến vi phân của nó không là zero), thì các costate cuối cũng phải có dạng

( 4 ) λ T ( T ) = Ψ x ( x ( T ) ) {\displaystyle (4)\qquad \lambda ^{\rm {T}}(T)=\Psi _{x}(x(T))\,}

Bốn điều kiện (1) - (4) là những điều kiện cần cho một điều khiển tối ưu. Lưu ý rằng (4) chỉ áp dụng khi x ( T ) {\displaystyle x(T)}  là tự do. Nếu nó bị cố định, thì điều kiện này là không cần thiết cho một tối ưu.